jjzjj

c++ - C++ 中带线程的强力搜索算法的并行化

全部标签

ruby - Ruby 字符串字典中的快速模糊/近似搜索

我有一个包含50K到100K字符串的字典(最多可以包含50个以上的字符),我正在尝试查找给定字符串是否在具有“编辑”距离公差的字典中。(例如Levenshtein)。在进行搜索之前,我可以预先计算任何类型的数据结构。我的目标是尽快针对该字典运行数千个字符串并返回最近的邻居。如果有一个明显更快的算法,我会得到一个bool值来说明给定的是否在字典中为此,我首先尝试计算所有Levenshtein距离并取最小值,这显然非常慢。所以我尝试根据这篇文章实现一个LevenshteinTriehttp://stevehanov.ca/blog/index.php?id=114在这里查看我的重现基准的要

ruby - 两个Ruby线程相关的问题

第一个:如何创建一个不会立即启动的线程。如果我在没有block的情况下使用initialize,则会引发异常。如何将Thread子类化,以便我可以添加一些自定义属性,但保留与Thread基类相同的功能?我也不想为此使用initialize(&block)方法。为了更好地说明这一点:第一个问题:x=Thread.newx.run={#thisshouldhappeninsidethethread}x.start#iwanttomanuallystartthethread对于第二个:x=MyThread.newx.my_attribute=some_valuex.run={#thissho

ruby-on-rails - rspec 中的多线程 ActiveRecord 请求

我正在尝试在测试中重新创建竞争条件,以便尝试一些解决方案。我发现在我在测试中创建的线程中,ActiveRecord总是为计数返回0,为查找返回nil。例如,表“foos”中有3行:it"whatever"doputsFoo.count5.timesdoThread.newdoputsFoo.countendendend将打印300000test.log显示了预期的查询,预期的6次:SELECTcount(*)AScount_allFROM`active_agents`知道这里发生了什么吗? 最佳答案 我假设ActiveRecord为

ruby - 单例类会在多线程应用程序中产生问题吗?

这可能是过早的优化,或过早的过度谨慎,但我避免在一些类上使用单例,因为我担心在未来我需要以多线程方式运行我的应用程序,而且单例会造成冲突和困惑。单例在Ruby中是否有这个问题,或者是否有某种内置的命名空间,以便当一个类引用单例时,只返回同一线程上的单例?编辑:澄清这些是可观察的类,当更新时会导致其他正在观察它们的类更新。我不确定这是否是线程安全的,但我知道现在我正在大量传递这些可观察的类,这有点烦人。而且它们看起来确实像是自然的单例类。 最佳答案 这是一个使单线程安全的例子。您必须像对待任何其他具有状态(@things)并且不是不可

ruby-on-rails - 向我的网站添加完整网络搜索的最佳方式?

我需要在我的站点中添加完整的网络搜索。我需要像GoogleCustomSearch这样的东西,但没有广告,而且它必须是免费的。任何可以为我的站点编制索引并允许我进行搜索的Web服务或开源项目的推荐都会有所帮助。如果有帮助的话,我的网站是用ruby​​onrails制作的。我会将这个问题制作成社区维基,这样您就可以编辑我糟糕的英语。我想很多人都可以从这个问题中受益。 最佳答案 查看Lucene。它是一个开源搜索引擎,在您自己的网站上实现肯定会是一种有趣的学习体验。我相信它最初是由Excite人员设计的。

ruby - 搜索并替换为 ruby​​ 正则表达式

我在包含HTML的MySQL列中有一个文本blob字段。我必须更改一些标记,所以我想我会在ruby​​脚本中完成。Ruby在这里无关紧要,但很高兴看到它的答案。标记如下所示:foobarmeow我只需要更改第一个foo每个文本block到something_else同时保留字符串的其余部分。似乎无法使用Ruby获得正确的PCRE正则表达式。 最佳答案 #Theregexliteralsyntaxusing%r{...}allows/inyourregexwithoutescapingnew_str=my_str.sub(%r{[^}

Ruby - 如何在不同线程上的每个数组元素上运行一个方法?

所以我有一个包含40000个元素的数组,我希望对每个元素运行一个方法。为了减少花费的时间,我正在考虑在多个线程上运行它。也许将数组拆分为多个数组并在不同的线程或其他东西上运行。但我不知道如何开始。假设数组是foo[],调用的方法是bar()。bar()返回一个字符串。代码执行后,我希望能够将所有字符串合并/添加到一个大字符串中。有没有办法做到这一点?我试图让我的问题尽可能简单,但如果您想了解更多信息,请告诉我。提前致谢! 最佳答案 听起来您想要类似pmap函数的东西。有一个名为peach的ruby库它在native数组上提供了pma

arrays - 在 ruby​​ 中实现的算法将 1 添加到表示为数组的数字

我需要有关Interviewbit上的问题的基于ruby​​的解决方案的建议。问题如下Givenanon-negativenumberrepresentedasanarrayofdigits,add1tothenumber(incrementthenumberrepresentedbythedigits).Thedigitsarestoredsuchthatthemostsignificantdigitisattheheadofthelist.Therecanbeupto10,000digitsintheinputarray.Example:Ifthevectorhas[1,2,3]t

Ruby Net::FTP 超时线程

我试图通过使用线程FTP连接来加速多个FTP下载。我的问题是我总是有线程挂起。我正在寻找一种干净的方法来告诉FTP它需要重试ftp事务,或者至少知道FTP连接何时挂起。在下面的代码中,我对5/6个单独的FTP连接进行线程处理,其中每个线程都有一个预期下载的文件列表。当脚本完成时,一些线程挂起并且无法加入。我使用变量@last_updated来表示上次成功下载的时间。如果当前时间+20秒超过了@last_updated,就杀掉剩下的线程。有没有更好的办法?threads=[]max_thread_pool=5running_threads=0Thread.abort_on_excepti

ruby-on-rails - 在 Ruby on Rails 中搜索 - 如何搜索输入的每个单词而不是确切的字符串?

我已经使用ruby​​onrails构建了一个博客应用程序,我正在尝试实现一个搜索功能。博客应用程序允许用户标记帖子。标签在它们自己的表中创建并且belong_to:post。创建标签时,标签表中的记录也会创建,其中标签的名称为tag_name并通过post_id关联。标签是字符串。我试图让用户以任何顺序搜索任何单词tag_name。这就是我的意思。假设某个帖子有一个标签是“rubycodecontroller”。在我当前的搜索功能中,如果用户搜索“ruby”、“ruby代码”或“ruby代码Controller”,就会找到该标签。如果用户输入“rubycontroller”,它将不会